Expectimax 算法 August 7, 2025 1037 words • 6 min read Minimax算法的核心假设是对手总是做出最优选择,这使其在面对非最优或随机对手时显得过于悲观。例如,在棋牌或骰子游戏中,结果本身具有不确定性,Minimax的“最坏情况”分析不再适用。 **Expectimax搜索**是Minimax的泛化,专门用于处理这类不确定性。它在博弈树中引入了**机会节点(Chance Nodes)** 来取代Minimax中的最小化节点(Minimizer... #Games#Adversarial Search
对抗性搜索与游戏理论 August 7, 2025 431 words • 3 min read 在传统搜索问题中,智能体可以使用搜索算法确定最佳计划并直接执行以达到目标。但在**对抗性环境**中,智能体面临一个或多个试图阻止其达成目标的对手。由于无法确定性地预知对手的策略和反应,传统搜索算法不再适用,我们需要新的算法类别来解决**对抗性搜索问题**,也就是**游戏**。 确定性零和游戏具有以下特点: - **确定性**:动作的结果是确定的,没有随机性 -... #Games#Adversarial Search
Minimax算法 August 7, 2025 2383 words • 12 min read Minimax(极小化极大)是一种在**零和博弈**中做出决策的经典算法。其核心思想是,在一个回合制、信息完全的对抗游戏中,我方(MAX玩家)总是希望最大化自己的收益,而对手(MIN玩家)则总是希望最小化我方的收益。算法假定对手每一步都会做出最优选择。 一个状态的**值 (Value)** 指的是当前玩家从该状态出发所能获得的**最优结果**。 - **终止状态 (Terminal... #Games#Adversarial Search
蒙特卡洛树搜索 August 7, 2025 1118 words • 6 min read 对于像围棋这样**分支因子**极大的应用,传统的Minimax及其变种算法因计算量过大而不再适用。**蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)** 为此类问题提供了强大的解决方案。 MCTS基于两个核心理念: 1. **通过模拟进行评估 (Evaluation by Rollouts)**:从一个状态 $s$... #Games#Adversarial Search